花费 27 ms
HanLP自然语言处理包介绍

支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换, ...

Tue Nov 21 22:00:00 CST 2017 1 15947
word2vec使用说明

word2vec是一个将单词转换成向量形式的工具。可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 一、理论概述 (主要来源于http://l ...

Sat Jan 02 03:17:00 CST 2016 0 8665
DeepLearning之路(二)SoftMax回归

Softmax回归 1. softmax回归模型   softmax回归模型是logistic回归模型在多分类问题上的扩展(logistic回归解决的是二分类问题)。 ...

Wed Apr 20 00:42:00 CST 2016 0 6909
ICTCLA中科院分词工具用法(java)

摘要:为解决中文搜索的问题,最开始使用PHP版开源的SCWS,但是处理人名和地名时,会出现截断人名地名出现错误。开始使用NLPIR分词,在分词准确性上效果要比SCWS好。本文介绍如何在windows系 ...

Wed Nov 18 18:32:00 CST 2015 0 5068
LibSVM使用指南

LibSVM使用指南 一、 SVM简介 在进行下面的内容时我们认为你已经具备了数据挖掘的基础知识。 SVM是新近出现的强大的数据挖掘工具,它在文本分类、手写文字识别、图像分类、生物序列分 ...

Wed Nov 11 17:52:00 CST 2015 0 2920
三种常用数据标准化方法

引入 评价是现代社会各领域的一项经常性的工作,是科学做出管理决策的重要依据。随着人们研究领域的不断扩大,所面临的评价对象日趋复杂,如果仅依据单一指标对事物进行评价往往不尽合理,必须全面地从整体的角度 ...

Fri Jul 13 01:00:00 CST 2018 0 1240
Deep Learning In NLP 神经网络与词向量

0. 词向量是什么   自然语言理解的问题要转化为机器学习的问题,第一步肯定是要找一种方法把这些符号数学化。  NLP 中最直观,也是到目前为止最常用的词表示方法是 One-hot Represen ...

Sun Jan 03 04:08:00 CST 2016 0 1981

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM